#aprendizaje en línea

Arrepentimiento dinámico sin parámetros: costos de movimiento variables

Aprende sobre nuevo algoritmo que logra arrepentimiento dinámico adaptativo sin parámetros para optimización convexa online con costos de movimiento variables.

2026-06-03 · 3 min

T-POP: Personalización en tiempo real con preferencias en línea

Descubre T-POP, personalización rápida de LLMs sin reentrenamiento usando preferencias en línea y bandidos duelistas.

2026-06-02 · 2 min

Algoritmo óptimo para bandits contextuales lineales con actualizaciones escasas

Descubre un algoritmo práctico y óptimo para bandits contextuales lineales con O(log log T) actualizaciones. Máximo rendimiento con mínima complejidad.

2026-06-02 · 2 min

SEArch: Selección optimista de políticas para búsqueda con radar UAV

SEArch reduce hasta un 30% el regret en búsqueda con radar UAV seleccionando dinámicamente la mejor política entre ruido y deriva.

2026-06-02 · 3 min

Selección Adaptativa de Ventanas para la Predicción de Riesgos Financieros

Aprende sobre BAWS: un algoritmo adaptativo que elige la ventana de datos ideal para pronosticar riesgos financieros como VaR y ES, superando métodos tradicionales.

2026-06-02 · 2 min

Aprendizaje en línea flexible de representaciones por similitud

Algoritmo en línea biológicamente plausible para representaciones dispersas e invariantes. Ideal para clustering, teselado y codificación en grandes datos.

2026-06-02 · 2 min

Seguridad Permisiva con Inferencia Confiable en Robótica Interactiva

Nuevo método certifica la seguridad de robots autónomos con filtros de creencia menos conservadores, usando predicción conforme para una interacción humano-robot más eficiente y segura.

2026-06-02 · 2 min

Lodestar: enrutador de inferencia LLM con aprendizaje en línea

Lodestar optimiza el enrutamiento de inferencia LLM mediante aprendizaje en línea, logrando hasta 4x menor TTFT en clústeres heterogéneos.

2026-06-02 · 2 min

Corregir división en árboles en línea con inferencia válida

La inferencia anytime-valid corrige la selección de divisiones en árboles en línea, mejorando precisión en flujos no estacionarios.

2026-06-01 · 3 min

Arrepentimiento óptimo dependiente de la brecha para el aprendizaje en línea estocástico privado basado en teoría de decisiones

2026-05-29 · 2 min

ADWIN: Ventanas Adaptativas para Destilación en Política Consciente del Horizonte

ADWIN: Destilación Adaptativa con Política Consciente del Horizonte. Descubre este método que optimiza modelos de aprendizaje automático adaptando el horizonte temporal para mayor eficiencia y precisión.

2026-05-29 · 2 min